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@ Clonaga des genes bfoA, bioD, bloF, bloC, bioH de Bacillus sphaertcus, vecteurs et cellules transformees et procede de 
preparation de la biotine. 

(g?) La presente invention concerne notamment une sequence 
d ADN correspondant a Tun des genes suivants de la chaine de 
biosynthese de la biotine chez les bacteries : gene bioA, gene 
bioD. gene bioF, broC et bioH. 

Des vecteurs comportant ces sequences permettent de 
transformer d'autres microorganismes afin d'ameliorer la 
production de biotine. 
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Description 

Clonage des genes bioA, bioD, bioF.bioC. bioH de Bacillus sphaericus, vecteurs et cellules transformees et 

procede de preparation de la biotine. 

La presente invention concerne la preparation de la biotine par fermentation en utilisant la techniaue des 
ADN recombinants. H 

La biotine est une vitamine necessaire pour rhomme, les animaux, ies plantes et pour certains 
microorganismes. 

Elle a ete isolee du jaune d'oeuf et on en trouve dans la levure de biere. les cereaies, differents oraanes 
sous forme fibre ou combinee a des proteines. 

Cette vitamine a ete notamment proposee comme regulateur du metabolisme cutane, notamment dans le 
traitement des dermites seborrheiques chez rhomme. 

Outre les differentes sources qui ont ete rappelees precedemment, la biotine est synthetisee par certains 
microorganismes, en particulier des microorganismes du genre Bacillus tel que Bacillus sphaericus 

La figure 1 schematise la chaine de biosynthese de la biotine a partir de I'acide pimelique dans ce type de 
microorganisme. Cette chaine de biosynthese comprend 5 etapes enzymatiques differentes dans lesquelles 
les genes mis en oeuvre sont denommes successivement bioC, bioF bioA bioD et bioB 

L'etude systematique de la production de la biotine a partir de I'acide pimelique au cours de fermentations 
industries a montre que certains microorganismes, particulierement ceux appartenant au genre Bacillus 
sphaericus, hyperproduisent des vitameres de la biotine de meme que la biotine (on appellera ci-apres 
20 vitameres ies differents intermediates conduisant a la biotine). 

Pour ces bacteries, parmi les precurseurs de la biotine, le DTB "(desthiobiotine) represente le composant { 
predominant qui est produit en quantite beaucoup plus grande que la molecule finale ■ la biotine * 

ll existe un fort controle de transcription reprimand la synthese de la biotine qui depend de la quantite de 
biotine presente dans le milieu de culture ; cette repression intervient dans E. coli de meme que dans Bacillus 
spnaencus. 

Mais aucune inhibition par "feed back" ne regule la biosynthese de la biotine dans E. coli et jamais un tel 
controle n'a ete decrit dans Bacillus sphaericus. 

^explication complete de la production d'une tres grande quantite de DTB (pour une quantite faible de 
biotine) a partir de I acide pimelique dans Bacillus sphaericus necessite encore une etude de bioloqie 
30 moleculaire tres importante sur ('organisation et la regulation de la voie de biosynthese de la biotine dans cette 
Dacrene. 

Les etudes preliminaires de certaines des enzymes biosynthetiques extraites et semi-purifiees a partir de 
souches de 8. sphaencus produisant le DTB ne relevent pas de differences marquantes avec les enzymes de 
la biotine bien connues dans E. coli. y 

35 iipS!n»r C,i0n ^ biotine par fermentation industrielle de telles souches de Bacillus sphaericus 
(IFO 3525 NCIB 9370 pourrait devenir competitive avec les precedes chimiques existants si le rendement en 
biotine etait ameliore. De facon a atteindre ce but. il serait interessant d'obtenir une hyperexpression 
constitutive de tous les genes biosynthetiques de la biotine dans ces souches 
On a, bien entendu, decrit la selection de souches de E. coli dereprimees. soit par leur resistance aux 

40 analogues de la biotine tels que I'alpha-dehydrobiotine, soit par selection de mutants hyper secreteurs de ■ 
biotine. II a egalement ete decrit des mutations "cis dominantes" qui agissent de facon pleoTotrope sur la 
synthese de tous les genes de la biotine organises en un un operon bipolaire. Des mutations agissant en trans - 
ont egalement ete mentionnees. bien que. en plus de leur pouvoir d'abolir le controle de la transcription des L 

45 gSrafe'de iSle ^ S ° UVent P, "° tr ° PeS ^ PeUVent 56 r * perCU,er SUr la P^siologie 

Ces methodes de selection microbiologique traditionnelle peuvent aussi etre appliquees aux souches de 
Bacillus sphaencus produisant du DTB, si I'on emet I'hypothese que le controle moleculaire de la biosynthese 
de la biotine et I organisation generate des genes de la biotine sont les memes que dans E coli 
Au-dela de toutes ces hypotheses, ('utilisation de souches mutantes dans des fermentations industrielles 
50 importantes et en culture continue necessite .a selection de mutants presentant un Seriile S 

^1T' qU L rep D res r te Une tSche diffiCile 6tant donn * |,absen « actuelle de methodes d'analyse 
genetique fine chez Bacillus sphaericus. uanaiyac 

n^r e ^L\ aP9 ^ C M e ^ ° U T ait consister a cloner tous les g^es de la chaine de biosynthese de la biotine a 
55 vZ I, , US Sphaericus P r °duisant du DTB, puis a modifier, in vitro, la region de controle en 

55 5 de fapon a suppnmer le controle de transcription. 

nonLT' 6 ; ! 6 C,0 , na9e 6t ' a mani P ula,ion in vitr ° ces genes permettraient I'etude de leur organisation 
generale et amelioration de leur transcription in vivo, par des techniques de genie genetique quf sont 

souCh^r TT % en , PartlCUlier '' u,ilisa,ion de P^^oteurs forts, connus pour Itre fonctionnels dans les 

soucnes de Bacillus sphaencus. 

s^TZ^iT^ d f t0 ° S Ce , S 9 ^, eS h yP erex P rim es et qui ne seraient plus regules par la biotine (mais qui 
seraient regules de fapon inducible en utilisant, par exemple. une induction par une augmentation de 
temperature ou par un substrat peu onereux) dans la souche originale de Bacillus sphaericus pourrait alors 
etre mise en oeuvre en utilisant les techniques connues de transformation, de transduction ou de 
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um ZrZ «i Sequences d ^ mentionnees precedemmen. puissent etre d'origine diverse on preferera 
rnmmp "T^r pr H ° Venant d Une souche de Bacil1 ^. en particulier d une souche de Bacillus spEaehcus 
J°?h 3 5 ' nd,qUe P r6c6demment ' 11 «t particulierement interessant que ces sequences d'ADN 

dp hi ?H° UrVU , eS , d ! S Sequences naturelles a «urant le contraie de la transcription des enwmes 5e la vo,e 
de biosynthese de la biotme chez la bacterie d'origine afin d'abolir la regulation naturell d btotinJ pi Z 

d P ^ C s\ Ce sou S c e h q e e S S S ° US 16 C ° ntr6le d ' 6 ' 6mentS Ch ° iSiS ' 

a s'T^T^Z Ceme - !? P f t,cu "«:- ,0Ut ou P artie des sequences qui sont representees dans les figures 4 
A 8 et 17 a 19 et qui cedent pour Tun des genes mentionnes precedemment 

n e e S n S r !?r nCeS d ' ADN Se ' 0n ' a Pr6sente invention P euvent etre utili «es de differentes facons 

CO nt e r a ?f^f e P ° Urra ' COnime C8la 3 6t6 indiqu6 ' gtre de ^P 9 wtonome et auto-replicable ou bien au 
contra,re, prevu pour assurer son integration dans le chromosome de la souche hote 

examples'! diff ' rem9S ,eChn0 '° 9ieS 3 me,tre en ° euvre son ' connues ou seront decrites dans les 

rt'.ii ckf™ ' e C3S d ' U . n !f CteUr d in,e 9 ration - celui-ci devra comporter au moins une sequence homoloaue 
d une sequence presente dans le genome de la souche 4 transformer, ce qui permettra d assurer HnSttoi 
2Zin° m,qU f • ^° Urra 6videmment S 'W' soit d ' u ™ sequence homologu 'corre^nd" 1 4 ™n e Sence 
Station" 3 6 ' S0,t d S6qU6nCe h ° m0l09Ue intr0duite P ar un vecteur plasZqu: 

^ITclllXZ ^ ^ aUt ° n0me 6t aUt0 --P llcable . " <^P°*era une origine de replication efficace 

tels a u m un7*n C «L di ^ re , ntS V °? ^ P lasmidi ^ es P° ur ™t comporter des elements assurant une selection 
de S ,a q souche I tansformer. 6 * antibi ° ,iqU9 e,/0U ^ marqU6Ur ' S0US ,a d6 P endan « ^ pSSS 

ncSJ^H 06 "" 163 P0U c Van . t SSrVir de S0UChe h6,e ' " faut ™ntionner plus particulierement les bacteries 
dr g ^l d c e cVar e orn e y S ce E s SCheriChia ' BaCi " US " P - d ™* ainsi que ,es lev'ures. en particulSleSres 
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conjugaison-mobilisation. 

On peut egalement envisager ['introduction de ces genes dans des differents micronrnanismoc ~ 
connus pour etre acceptable dans rindustrie alimentaire et qui sont perS S ° m 

Enfin la stabihsation de ces .nformations genetiques dans les microorgan.smes pourrait etre realisee oar 
une ,ntegrat.on dingee dans les chromosomes ou par une autoselect.on de plasmides tel qu cela St Sent 
par exemple, dans le brevet francais no 84 12598 *' 

- gene bioD 

- gene btoF 

- gene bioC 

- gene bioH. is 
Certaines de ces sequences d'ADN selon Invention sont liees sous forme de -cluster" a , P r i* n»n» k- a 

- bioB et bioD 

- bioB, bioD et bioA 

- bioB, bioD, bioA et bioF 

different? vt S me q res nCe Utili " ^ dM V6CteUrS aPPr ° Pr " S Perme ' ' a de Ia ^ a P^ir de ses 25 

Ceux-ci peuvent, comme cela sera decrit ci-apres. etre egalement prepares par fermentation en utilisant 

L^TtZS™ eXPnmem " qUenCeS d ' A ° N qUl C ° dent P ° Ur ,a ° U ' es S i geS ' 

- bioF et bioH 

- bioF, bioC et bioH, 30 
ainsi^que les sequences qui cedent, en pius des sequences precedents, pour les genes : 

- bioA et bioD, ou 

- bioA, bioB et bioD. 
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Parmi les cellules notes particulierement interessantes, il faut citer Bacillus sphaericus, Bacillus subtilis et 
Escherichia coli. 

Enfin, les souches plus particulierement tnteressantes pour etre transformees par les sequences d'ADN 
selon la presente invention sont les souches qui ont deja ete transformees par des vecteurs assurant 
5 I'expression des autres genes de cette voie de biosynthese, c'est-a-dire les genes F, A, D et B tels qu'ils sont 
decrits dans la presente demande. 

Dans ces conditions, I'introduction des genes bioC et bioH dans la bacterie permet a cette bacterie de 
synthetiser la biotine a partir du premier vitamere de la chaine, a savoir le pimelate, ce qui presente un interet 
economique important sur le plan industries 
10 Dans le cadre de la presente invention, le vecteur plasmidique d'integration est plus particulierement le 
plasmide pTG475 qui sera decrit ci-apres et qui comporte notamment un promoteur inductible. 

Lorsque le vecteur comporte une origine de replication autonome, les sequences d'ADN codant pour les 
enzymes mentionnees precedemment seront, de preference, flanquees d'elements de contrdle assurant leur 
expression dans la souche note ; ii s'agira en particulier, a t'extremite 5', d'un promoteur fort, efficace dans 
15 ladite souche et eventuellement d'autres elements tels qu'une sequence de terminaison lorsque la souche 
note sera une levure ou tout autre microorganisme ou une telle sequence est necessaire. 

La presente invention concerne egalement les cellules transformees par les plasmides vecteurs selon 
('invention. Parmi ces cellules, il faut citer plus particulierement les bacteries, notamment des genres Bacitlus, 
Escherichia ou Pseudomonas, mais egalement les levures. en particulier du genre Saccharomyces. 
20 Parmi les souches qui peuvent etre transformees par ces vecteurs, il faut citer les souches qui produisent 
deja de la biotine ou Tun de ses vitameres. 

Enfin, la presente invention concerne un procede de preparation de la biotine dans lequel on fait fermenter 
un milieu de croissance contenant au moins de I'acide pimeiique, ou Tun des vitameres de la biotine, par des 
cellules telles qu'elles ont ete decrites precedemment, qui soient permeables soit a I'acide pimeiique, soit 
25 auxdits vitameres de la biotine et en ce qu'on recupere la biotine produite. 

Le procede selon I'invention peut etre mis en oeuvre avec differentes variantes. 

En particulier, il est possible de preparer te vitamere in situ a ('aide de cellules transformees par un vecteur 
selon ('invention, notamment une souche transformee contenant les genes bioF, bioH et bioC peut etre 
capable de produire KAPA a partir de I'acide pimeiique, la transformation de ce KAPA en biotine etant 
30 effectuee par une souche portant les genes complementaires D, A et B par exemple. 

I! est possible de prevoir deux fermentations successives ou bien une co-fermentation si les souches en 
presence s'y pretent. 

II est egalement possible de prevoir la complementation d'une souche qui ne possede qu'une partie des 
genes en cause, ou encore de transformer une souche qui est deja productrice de biotine pour la rendre 
35 surproductrice. 

D'autres caracteristiques et avantages de la presente invention apparaitront a la lecture des exemples 
ci-apres decrits en se referant aux figures sur lesquelles : 

. la figure 1 represente la chaine de biosynthese de la biotine, 

. la figure 2 schematise le piasmide pTG1400, 
40 . la figure 3 schematise le plasmide pTG475, 

. la figure 4 represente la sequence non codante en amont de la sequence LORF no 1 , 

. la figure 5 represente la sequence LORF no 1 correspondant au gene bioD, 

. la figure 6 represente la sequence LORF no 2 correspondant au gene bioA, 

. la figure 7 represente la sequence LORF no 3 correspondant au gene Y, 
45 . la figure 8 represente la sequence LORF no 4 correspondant au gene bioB, 

. la figure 9 schematise I'etude de complementation de pTG1400, 

. la figure 10 schematise I'etude de complementation entre differents plasmides, 

. la figure 1 1 schematise la structure du plasmide pTG1418, 

. la figure 12 schematise I'essai de complementation de pTG1418, 
50 . la figure 13 represente la carte de restriction de I'insert de B. sphaericus utilise dans les plasmides 

suivants : 

.la figure 14 schematise les plasmides pTG1418 et pTG1420, 
. la figure 15 schematise les plasmides pTG1422 et pTG1435 t 
. la figure 16 schematise les plasmides pTG1436 et pTG1437, 
55 . la figure 17 represente la sequence LORF X, 

. la figure 18 represente la sequence LORF W, 
. la figure 19 represente la sequence LORF F, 
. la figure 20 schematise le plasmide pTG1 440, 

. la figure 21 represente la carte de restriction de I'insert du plasmide pTG1418, 
SO . les figures 22 et 23 represented les differents plasmides derives du pTG1418 utilises dans les tests de 

complementation. 

Pour des raisons de simplification, les sequences d'ADN et les structures des plasmides ont ete 
representees dans les dessins annexes, il est toutefois entendu qu'elles doivent etre considerees comme 
faisant partie integrante de la presente description. 

65 
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EXEMPLE 1 



Clonage par complementation d es genes bioA et bioD de Bacillus sphaericus IFO 35 25 et mise en evidence d P 
leur liaison avec bioB — " ■ '^ aq ° 

a) Dans E. coli 

Bacillus sphaericus IFO 3525 est mis en culture dans 200 ml de milieu de culture PAB (DIFCO Bacto 
antibiotique, milieu 3, 17,5 g/l) a 37* C pendant 17 heures. Les bacteries sont recuperees par centrifugation et 
I ADN total est alors extrait a parlir des cellules par la methode de Saito (Saito et al. BBA 1963 72 619-6291 
Une quantite de 450 ug d'ADN pur est obtenue. ' ~' 

20 ug de I'ADN total sont mis en restriction totale avec Hindlll (3 U/ug d'ADN). pBR322 est traite avec la 
phosphatase alcaline apres avoir ete completement digere par Hindlll. 

Les plasmides recombinants hybrides sont obtenus en m6langeant I'ADN genomique digere par Hindlll (2 
ug) et pBR322 traite comme precedemment (1 ug) avec 2 unites de ligase T 4 (Boehringer Mannheim) dans 50 
uldu tampon r6actionnel contenant NaCI 30 mM, Tris HCI pH 7,5 30 mM, MgC! 2 10 mM, EDTA pH 8 0 2 mM 
DTT 2 mM, ATP pH 7 0,5 mM et BSA 0.1 mg/ml. L'incubation est effectuSe a 14°C pendant 16 heures Des 

nm!™t«n^ oVlf ti0n + f° nt 1™ aj ° Ut ' eS danS Une ex P^ ie " ce de transformation (Cohen et al. 
1972) PNAS 69. 2110-2114) en utilisant la souche E. coli C600 r K - m K + et en selectionnant les souches pour 
leur resistance a ramplcilline (100 u.g/ml) sur milieu LB. 

4 "pools' differents d'ADN plasmidique sont alors extraits, chacun correspondant a une moyenne de 10* pn 
clones mdividuels sur les boites de transformation. 

Diff6rents mutants bio de E. coli sont alors transformer avec ces "pools" d'ADN et les transformer sont 
selectionnes soit en presence d'ampicilline (100 ug/ml) sur milieu LB soit pour la resistance a cet antibiotique 
et pour la prototrophic pour la biotine en meme temps (milieu LB + ampicilline 100 ug/ml 4- avidine 0 2 U/ml) 

Les resultats observer sont rassembtes dans le tableau 1 : 



Tableau 1 

Genotype de la souche Selection Amp. Selection sur milieu Amp 
de E. coli Transfo rmants/ug d'ADN 

+ avidine Q T 2 U/ml 

transformants/u-g d'ADN 



C268* AbioA, his > |Q 3 



3 (pool n° <0 



C173* t bioD, his > io 3 

(pour chaque pool) 



(pour chaque pool) 1 (pool n° 1) 

2 (pool n° <0 



w 



15 



25 



30 



35 



40 



45 



♦ : Cleary et Campbell (1972) 3. Bacterid. _H2, 830. 

50 

Les plasmides sont isoles a partir des clones selectionnes sur ampicilline + avidine et analyses en utilisant 
des enzymes de restriction. Trois plasmides (2 provenant de la souche C268 et 1 de la souche C173] 
cont.ennent un insert Hindlll de 4,3 kb avec un site Bglll et 2 sites Sphl et sans site BamHi, Sail. Pstl. EcoRV 
Pvull, Aval. 

Avec run de ces plasmides, denomme pTG1400, et dont la carte de restriction est representee a la figure 2 55 
il est possible de retransformer en selectionnant pour la resistance a I'ampicilline et la prototrophie pour la 
o?io?: aUSSi bi6n ' eS soucnes 0268 < AbioA >. C173 (AbioD), R877 (bioD19) (Cleary et Campbell 1972) ou 
C162 (bioB) avec una frequence moyenne correspondant a celle obtenue pour la selection avec I'ampicilline 
£2i« fl? Par * 9 d ' ADN >- Aucune complementation de I'auxotrophle pour la biotine des souches 
R878 (bioC23) ou R901 (AbioA-D) (Cleary et Campbell. 1972) ne peut etre obtenue en utilisant pTGHOO. 60 

b) Dans Bacillus subtilis 

La complementation des mutants bio de Bacillus subtilis pourrait se reveler difficile car il est connu que des 
deletions peuvent se produire avec une frequence tres importante dans les inserts etrangers clones dans les 
plasmides rephcatifs usuels de Bacillus subtilis. C'est pourquoi il a ete developpe une nouvelle strategie basee 55 
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sur des essais de complementation a I'aide d'un plasmide non replicatif. L'integration de plasmides non 
replicatifs dans I'ADN genomique de Bacillus subtilis intervient avec une frequence assez elevee (environ 10 4 
transformants/ug d'ADN), en utilisant des cellules naturellement competentes de Bacillus subtilis, si des 
regions homologues existent entre I'ADN genomique et fe plasmide. 

5 La premiere etape consiste a integrer le plasmide pTG475 dont la structure est indiquee a la figure 3 dans 
differents mutants bio de Bacillus subtilis. 

Le plasmide pTG475 contient le gene XylE qui code pour I'enzyme C2.3 oxygenase (Zukowski et al. (1983) 
PNAS USA, 80, 1101-1105), qui peut etre utilise comme marqueur chromogenique (jaune) et qui est exprime 
sous le controle du promoteur inductible du gene de la levane sucrase de Bacillus subtilis. Ce plasmide 

W comporte egalement un gene CAT conferant la resistance au chloramphenicol ; les genes CAT et XylE sont 
inseres dans pBR322. 

Ce plasmide est integre dans le chromosome des souches suivantes de Bacillus subtilis : 
. souche btoA : JKB 3173 (bioA 173, aro G932 ; CH Pai (1975) J. Bacteriol. 121^, 1-8). 
. souche bioB : BGSCIA92 (bioB 141, aro G932 Sac A 321, Arg A2 ; CH Pai (1975) J. Bacteriol. 121, 1-8, 
15 . souche bio112 : JKB 3112 (bio 112 ; CH Pai (1975) J. Bacteriol. 121, 1-8). 

par la technique de transformation des cellules competentes de R.J. Boyland (1972) J. Bacteriol. 1 10, 281-290, 
la selection etant effectuee surTBAB (DIFCO Blood tryptose agar base)) plus chloramphenicol 3 £g7ml. 

Differents contrdles sont effectues sur les clones transformes : ils virent au jaune lorsqu'on induit avec le 
sucrose, et en outre un controle par hybridation Southern pour les souches bioA, bioB et bio112 montre que 
20 l'integration de pTG475 par recombinaison simple dans le promoteur du gene de la levane sucrase a eu lieu. 
Ces souches transformees de Bacillus subtilis sont appelees bioA TG1, bioB TG2 et bio112TG3. Le plasmide 
pTG475 ayant apporte des sequences de pBR322 dans le genome de Bacillus subtilis, il devient possible 
d'integrer, par recombinaison homologue, tout plasmide etranger comportant ces memes sequences. 

Dans une deuxieme etape, le plasmide pTGHOO, prealablement clone par complementation dans E. cofi, a 
25 ete utilise pour transformer les souches de Bacillus subtilis bioA TG1 , bioB TG2 et biol 12TG3. La selection est 
effectuee sur milieu LB + avidine 0,2 U/ml + chloramphenicol 10 ug/ml. 

On observe qu'il est possible de selectionner, a une tres haute frequence, des transformants prototrophes 
pour la biotine a partir de souches bioA TG1 et bioB TG2 mais pas avec la souche bid 12 TG3. pTG1400 ne 
compiemente done pas la mutation bio 112. 

30 

c) Caracterisation finale de I'insert Hindlll de pTG1400 

Des experiences d'hybridation Southern ont ete effectuees de facon a detecter le meme fragment Hindlll 
dans I'ADN genomique de Bacillus sphaericus IFO 3525, correspondant a I'insert de pTGHOO. 

Dans des conditions d'hybridation drastiques (50 % de formamide, 0,6 o/o de solution de Denhardt, 0,1 % 
35 SDS, 3xSSC a 42° C) et en utilisant un plasmide pTGUOO marque au 32 P par incorporation de nucleotides 
radioactifs par polymerisation in vitro ( "nick translation") (2.5. 10 7 cpm/^ig d'ADN), une seule bande Hindlll de 
4,3 kb a pu etre visualisee dans I'ADN genomique de Bacillus sphaericus IFO 3525 apres 6 heures 
d 'autoradiographic a -80°C. II a ete verifie que dans ces conditions d'hybridation pBR322 ne donnait pas de 
reaction croisee avec I'ADN genomique de Bacillus sphaericus IFO 3525. Dans ies memes conditions, aucune 
40 reaction positive, avec pTGHOO comme sonde, n'a pu etre detectee dans I'ADN genomique de Bacillus 
subtilis BGSC1A289 traite par Hindlll ou dans I'ADN genomique de E. colt C600 traite avec Hindlll. 

La sequence d'ADN totale du fragment Hindlll de 4,3 kb a ete analysee en utilisant la methode "Shotgun", 
e'est-a-dire le clonage systematique des fragments obtenus par sonication, les "deletions cyclones" ou les 
elongations avec oligonucleotides-primers. 
45 Pour la methode "Shotgun", le plasmide pTGUOO a ete decoupe par traitement aux ultrasons. Apres 
traitement des segments d'ADN avec I'ADN polymerase du phage T 4 , les fragments aux extremites franches 
sont mis a migrer sur un gel d'agarose a bas point de fusion et des fragments d'environ 300 pb sont isoles. 

Le clonage de ces fragments a ete realise dans des vecteurs M13 digeres par Smal et traites a la 
phosphatase, . 

50 Les plages blanches qui ne donnent pas d'hybridation croisee avec PBR322 sont triees et 100 clones sont 

sequences. Les resultats ont ete analyses par ordinateur. 

Un procede recent pour I'obtention d'une serie de clones se chevauchant (le systeme cyclone) a ete utilise 

pour le sequencage de I'ADN (R.M.K. Dale, B.A. Mc Clure, J. P. Houchins (1985) Plasmid 13, 31-40). Cette 

methode a ete poursuivie en parailele avec la methode "Shotgun", de facon a confirmer les resultats. En outre, 
55 cette methode produit des plasmides deletes definis contenant des groupes de genes bio ou des genes bio 

isoles. 

La sequence complete du fragment Hindlll de pTGUOO est representee aux figures 4, 5, 6, 7 et 8. 
L'analyse par ordinateur de cette sequence revele que le fragment a la capacite de coder pour quatre longs 
cadres de lecture ouverts (LORF). Les sites possibles d'initiation de la traduction et les regions Shine et 
60 Dalgarno sont soulignees. Une region palindromique est soulignee a I'extremite 3' de la sequence qui pourrait 
representer un site de terminaison de transcription. 

L'analyse de complementation detaillee montre que la premiere region LORF (figure 5) (avec 3 sites 
d'initiation de traduction possibles) correspond au gene bioD. 

Des experiences connues sous le nom de " maxicellules" ont ete realisees avec la souche de E. coli CSR 
65 603 (recA1, phr-t, uvrA6, thr-1, leu-6, thi-1, argE3, lacY1, galK2, ara14, xy!15, mtt1, proA2, str-31. tsx-33, 
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Sp^nt^en'ron's ''£" m ° ntrent ^ ^ ^ U ° P °' ypeptide 3VeC d ' un P° ids mol ^ula,re 
La seconda region LORF (figure 6) (avec 4 sites d'initiation de traduction possibles) correspond au cene 

b.oA. Une '.experience en ■max.cellulee' de E. coll CSR603 revele un polypeptide d'un poids moleculaire 

apparent d environ 40 kd qui correspond au produit du gene bioA moiecuiaire 
II n'a pas ete possible de determiner la fonction de la troisieme sequence LORF, appelee gene Y (fioure 7) 

Une res grande tydrophobic.te et la presence d'une sequence signal probable dans la region 

mernfa™ TV? L ° RF ' S " " v 1 tra0SCrit 61 tradUit " COde P0Uf Une ^™ a * an < interS^n avec la 
I" 1 ™, 18 fait ^ c , e 9 ene Y S0lt en "duster- avec les autres genes bio (A. D et B) suggere qu'il code pour 
une autre fonction impliquee dans le metabolisme de la biotine P 

La quatrieme region LORF (figure 8) (avec 3 sites d'initiation de la traduction possibles) a deja ete identifiee 
B "es b?oA et' btoS. ' bi ° B ' " ^ M ™ ^ 68 ^ 6St °" "^-te' " avecTes 

Hindin r a i y f^ d H C °T^^ ntati0n aVSC deS P ,asmi ^s contenant des regions sous-clonees de ('insert 
rpSS . nor b ^ PT ^ 14 °° m ° ntr8 clairement - com ™ ceta est represent a la figure 9, que la premie 
region LORF correspond au produit du geneD et que .a seconds region LORF correspond au produit dug 'ne 

EXEMPLE 2 

Clonage par complementati on du gene bioF de Bacillus sphaerie us IFO 3525 20 
„ Manque a aun genomique Hindlll de Bacillus sphaerieus IFO 3525 decrite precedemment a ete utilisee 
pour transformer un mutant de E. coli. bioF 12, en survant la methodologie decrite pSdemment 
Les resultats obtenus sont assembles au tableau 2 : preceaemment. 



Tableau 2 

Genotype de la souche Selection Amp. Selection sur mili*,, 

de E ' C0h Amp,, avidine 0,2 U/ml 

Transforma nts/pg d'ADN Transformants/ue d'ADN 

R87»* bioF 12, his >| 0 * 2 (pool n . 1} 

(pour chaque pool) 2 (pool n° 3) 

4 (pool n° <t) 

* Cleary et Campbell (1972) J. Bacteriol. J_[2, 830 

i- a ^?n? a t mid ? iS °'t S ^ Partir dSS Cl0neS s6lec «onnes sur milieu contenant de I'ampicilline et de 
I avidine et analyses en utilisant des enzymes de restriction. <*"'piuiiine ex ae 

Deux de ces plasmides contiennent deux inserts Hindlll d'environ 4,5 et 0 6 kb avec des sites Snhl Knm 

a^rtss,%, x ti. p si- s. s,ul et sans site B9,,, ■ xbai - ^ - -~ ™. 
,, A a ; e p^ 

01 D e e s nn e e x „ C r rreSPOn H ant * Cel ! 8 ° bt6nUe P ° Ur 13 S6leCti0n deS Cl0 " es SUr am P^ de 10Vu ^ d'ADN, 
kapa eXpe h 1t nCes de sous-clonage ont montre que seul le fragment Hindlll de 4.5 kb code pouMa fonction 
KAPA synthetase assurant la complementation de la mutation bioF12 de la souche R874 de E coli 

Des expenences de "Southern" ont ete effectuees de facon a detecter le fragment HindHI de 45 kb dans 
I ADN genomique de Bacillus sphaerieus IFO 3525 en comparison avec I'insert de 4 5 kb de DTG141 En 
ub sant d« .conditions d'hybridation tres drastiques (50o/ 0 de formamide, SxSSC 0 1 «V 0 SDS 0 6 ol' de 
au 3 T 0A r^rZr\ 2 ? * utilisant M13 ™<25 M13 contenant I'insert Hindlll de 4 fkb mlS 

I n P n W ? 0rat ?" I 6 " ucleotldes radioactifs par polymerisation in vitro ("nick translation " avec 2 10* 

sphaerfcus IFO 3525 SSJ 'h'"' ''TT *5 * PeUt *™ ™ M * dans I'ADN genomique de Baci us 
spnaencus IPO 3525 apres 7 heures d autoradiographie a -80° C. °*w»u& 
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Dans les memes conditions, aucune reaction positive ne peut etre detectee, ni sur I'ADN genomique de 
Bacillus subtilis BGSC1 A289 traite par Hindlll ni sur I'ADN genomique de E. coli C600 traite par Hindlll. 

Aucune reaction croisee ne peut etre detectee entre I 1 insert de pTG1400 et les inserts de pTG1418, ni avec 
un fragment Spht de 8,3 kb de pTG1406 chevauchant I'extremite 3' de pTG1400, ni avec un fragment Mbol de 
5 8,2 kb de pSB01 chevauchant I'extremite 5' de pTGHOO (voir figure 10). 

La carte de restriction des inserts de pTG1418 a ete analysee et est indiquee a la figure 11. 

Les etudes de complementation et I'analyse "Southern" demontrent que le gene bioF de Bacillus 
sphaericus IFO 3525 n'est pas lie aux genes bioA, bioD et bioB du meme microorganisme (figure 12). 

10 EXEMPLE 3 

Complementation du mutant de B. subtilis bio112 TG3 (derive de JKB 3112, bioC/F-112 aroG932) par 
transformation integrative avec pTG1418 et differents derives de celui-ci 
Le mutant biol 1 2 de B. subtilis a ete identifie par des tests nutritionnels comme affecte dans la fonction bioF 
75 ou bioC (C.H. Pai, 1975, J. Bacterial 121^, 1-8). Dans ce mutant, le plasmide pTG475 a ete integre au niveau du 
locus sacR - sacB, suivant la methodologie decrite precedemment, la nouvelle souche ainsi obtenue a ete 
denommee biol 12 TG3. 

La transformation de la souche bio112 TG3 par differents plasmides (pTG1418. 1420, 1422, 1435, 1436 et 
1437, represents dans les figures 13 a 16) a ete effectuee, suivie d'une selection sur milieu LB + 
20 chloramphenicol 10 Lig/ml + avidine 500 U/l. Les resultats de complementation sont resumes dans le tableau 
3. Comme le test croise avec le mutant R874 (bioF, his) de E. coli donne le meme resultat. il est vraisemblable 
que le mutant biol 1 2 de B. subtilis est affecte dans le gene bioF. En analysant les complementations obtenues 
en fonction des plasmides utilises, il est possible de localiser le gene bioF sur I'insert de pTG1418 au niveau *< 
d*un fragment delimite par les sites de restriction Xmnl et Ncol (voir figures 21 a 23). 

25 

Tableau 3 

30 _ 

Transformation integrative de la souche de 
B. subtilis biol 12 TG3 

35 

Complementation sur LB » 
Plasmide Insert 500 U/l avidine f 10 Mg/ml 

chloramphenicol 

Insert Hindlll de 5,1 kb * + 

Insert Clal de 3,1 kb conte- 
nant bioF et une partie de 
LORF W 

Insert Clal-Hindlll de 2 kb 
contenant X et une partie 
de LORF W 

Insert Xmnl-tNcol de 1,3 kb 
contenant ie gene bioF 

Insert NcoI-XmnI de l t 3 kb 

contenant le gene bioF + + 

Insert Hpal-PvuII de 0,6 kb 
contenant le LORF X 



40 pTGUlS 
pTGU22 

45 

tCU20 

50 

pTG1^36 
55 pTGU37 
pTGU35 

60 
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EXEMPLE 4 



Sequence nucleotidique de I'insert Hindlll de 4,53 kb du plasmide pTG1418 

L'insert Hindlll a ete clone dans le M13TG131 au niveau du site correspondant du polylinker. La methode 
dite "cyclone* a ete appliquee sur ce plasmide M13TG1425 et les resultats analyses par ordinateur. Les 5 
queiques differences de lecture entre les deux brins complementaires ont ete eclaircies sur sequenpage a 
I'aide d'oligonucieotides specifiques. 

La sequence est detaillee dans les figures 17 a 19. II apparait que cet insert comporte trois cadres ouverts 
de lecture, codant respectivement pour des proteines (sous-unites) d'un poids moleculaire de 18462, 28048 et 
42940 daltons. Le dernier gene, par rapport au sens de lecture, se trouve localise dans la region identified 10 
comme bioF, le poids moleculaire de cette proteine de B. sphericus etant du meme ordre de grandeur que 
celui de la KARA synthetase de E. coli (M.A. Eisenberg, 1973, adv. Enzymol. 38. 317-372). 

La juxtaposition des trois cadres ouverts de lecture pourrait §tre, comme dans le cas de l'insert du plasmide 
PTG1400, typique d'une structure operonique. II est a noter que Ton peut identifier, en amont du premier gene, 
une sequence de 15 paires de bases (soulignee dans la figure 17) presente egalement en amont du premier 15 
gene (bioD) de l'insert du plasmide pTG1400. Cette caracteristique significative pourrait indiquer que les deux 
groupes de genes biotine de B. sphaericus sont soumis au moins a une regulation commune. Celle-ci pourrait 
correspondre au contraie par la biotine (ou un derive de celle-ci). comme cela a deja ete decrit pour la KAPA 
synthetase (bioF) de B. sphaericus (Y, Yzumi, K. Sato, Y. Tani et K. Ogata, 1973, Agric. Biol. Chem. 37, 1335). 

Du cote 3' du dernier gene de I'insert sequence, une sequence presentant les caracteristiques d'un 20 
terminateur de transcription peut §tre identifiee (soulignee dans la figure 18). 

EXEMPLE 5 

Complementation des mutants E. coli R878 (bioC, his) et C261 (AbioFCD, his) respec tivement a I'aide des 25 
plasmides pTG1418 (1433) et pTGt440 ~ 

La methodologie traditionnelle des complementations de mutants bio de E. coli a ete appliquee en uttlisant 
le plasmide pTG1418 et differents derives de celui-ci. 

Lorsque des cellules competentes du mutant E. coli R878 (bioC, his) sont transformees avec les plasmides 
pTG1418 et pTG1433 (voir tableau 4), puis ensuite etalees sur milieu LB + ampiciiline 100 u^g/ml + avidine200 30 
U/l, une croissance est detectee apres 36 h d'incubation a 37° C. La frequence d'apparition des clones 
transformes sur ce milieu est du meme ordre de grandeur que celle mesuree sur le milieu LB + ampiciiline 1 00 
(ig/ml. 

Tableau k 35 
Transformation du mutant E. coli R878 bioC 
Nombre de transf ormants par d'ADN 



Selection sur milieu LB Selection sur milieu LB * 
Plasmide * ampiciiline * ampiciiline - awdine 

(100 pg/ml) (IGC ug/ml) (200 U/l) 

PTG1M8 10 3 10 3 petits 



pTGl^33 10 3 10 3 



petits 



Les deux inserts des plasmides pTGHOO et pTG141 8 ont ete clones dans pBR322 pour donner le plasmid 
pTG1440 (figure 20). Ce plasmide pTG1440, lorsqu'il est introduit dans le mutant E. coli C261 (AbioFCD, his 



40 



45 



pBR322 10 3 0 50 



(apres 36 h d'incubation 

a 37°C) 55 



Les croissances des clones transformes, normales sur LB + ampiciiline, sont ratenties en ['absence de 
biotine (milieu LB -I- ampiciiline + avidine ; minimum plus casaminoacides, d6pourvu de biotine). Cette 60 
complementation de I'auxotrophie en biotine du mutant R878 bioC est tout a fait significative, etant donne 
('absence totale de croissance rediduelle de ce mSme mutant, lorsqu'il est transforme par divers plasmides 
derives de pBR322, sur milieu depourvu de biotine. 



e 
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permet la selection de clones sur milieu LB ampicilline 100 jig/ml + avidine 200 U/l. La frequence de 
transformation obtenue est directement comparable a celle mesuree sur LB 4- ampicilline. A nouveau, la 
croissance de ces clones recombinants, noramie sur milieu LB + ampicilline, est ralentie en ('absence de 
biotine. De ces deux resultats (complementation de I'auxotrophie en biotine du mutant bioC et bioAFCD), il 
5 ressort clairement que I'insert du plasmide pTG1418 contient egalement le gene bioC de B. sphaericus. Les 
differents sous-clonages derives de ('insert de pTG1418 (figures 21 a 23) ne permettent pas d'obtenir la 
complementation de la mutation bioC de E. coli. Seuls les inserts possedant les trois genes conferent une 
complementation effective de la mutation bioC de E. coli. 

10 EXEMPLE 6 



15 



20 



25 



30 



Complementation du mutant E. coli bioH (PA5Q5 MAA108, argH, met A, bioH, malA, strr) 

Ce mutant a ete decrit a I'origine comme bioB (D. Hatfield, M. Hofnung et M. Schwartz, 1969, J. Bacterid. 
98? 559-567). II a ete ensuite caracterise comme n'excretant aucun vitamere et capable de croitre sur milieu 
mineral en presence de KAPA, DAPA, DTB ou biotine. Eisenberg (1985, Annals New York Academy of 
Sciences 447 , 335-349) a ensuite propose que ce gene code pour une sous-unite de la pimeloyl-CoA-synthe- 
tase (bioH). II est a noter que les mutants de E. coli surproducteurs de biotine (selectionnes soit par un niveau 
d'excretion de vitamine permettant la croissance d'un auxotrophe bioB de E. coli, soit par resistance a 
I'alpha-dehydrobiotine) ont tous ete identifies genetiquement comme affectes au locus bioR. Ce locus code 
pour une proteine multifonctionnelie (represseur de la synthese des ARN messagers de Toperon bioABFCD 
et holoenzyme synthetase fixant la biotine sur un residu lysine de differentes apoenzymes a fonction 
carboxylase). 

Le fait que tous les mutants de E. coli surproducteurs de la biotine identifies a ce jour sont localises dans le 
gene codant pour le represseur actif en trans et jamais dans I'operateur de I'operon bioABFCD laisse 
supposer qu'un autre gene de la biosynthese de la biotine est soumis a cette regulation. Au regard de la 
litterature, le meilleur candidat est le gene bioH. 

L'insert de pTG1418 contenant les genes bioF et bioC de B. sphaericus, on a recherche si !e trotsieme gene 
correspondait a bioH. 

La complementation du mutant bioH de E. coli aeffectivement ete obtenue en utilisant le plasmide pTG1433. 
Une nouvelle fois, la croissance obtenue sur ce milieu est ralentie, mais tout a fait significative par rapport aux 
temoins (voir tableau 5). 



35 



Tableau 5 

Transformation du mutant E. coli bioH PA5Q5 MAA108 
Nombre de transformations par (jg d'ADN 



4 ® Selection sur milieu LB 

Plasmide + ampicilline 

(100 Mg/ml) 



Selection sur milieu LB 
- ampicilline + avidine 
(100 pg/ml) (200 U/l) 



45 pBR322 
pTCl«3 



10 



io- 



0 



10 petits 



50 



(apres 36 h d'incubatior 
a 37°C) 



55 



60 



De meme que pour la complementation du mutant bioC, une condition necessaire et suffisante pour la 
complementation du mutant bioH est la presence simultanee des trois genes de l'insert de pTG1418 sur les 
plasmides introduits dans la souche (figures 21 a 23). 

Au contraire des mutants bioF de E. coli et de B. subtilis, pouvant etre complements par un seul gene de B. 
sphaericus, la croissance en ('absence de biotine des mutants bioC et bioH de E. coli ne peut done etre 
obtenue que lors de I'introduction des plasmides recombinants porteurs des trois genes de l'insert Hindlll du 
pTG1418. Ceci pourrait refeter, entre autres, des differences de proprietes enzymatiques entre la 
pimeloyl-CoA-synthetase de B. sphaericus et I'enzyme correspondante de E. coli (difference d'affinite 
vis-a-vis des substrats, edifice multienzymatique, notamment) ou une synthese reduite de la pimeloyl-CoA- 
synthetase de B. sphaericus dans E. coli, limitant le flux metabolique du pimelate vers le KAPA. 
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EXEMPLE 7 



10 



15 



Test fonctionnel des genes bio FCH 

Les tests de complementation des mutants bioF. bioH et bioC de E. coli a I'aide de plasmides recombinant, 
porteurs d ,nserts denvant du fragment Hindlll de 4,5 kb .sole a partir de B. sphaericus peuvemitre ^Zus 
comme une preuve de la presence sur cet ADN des genes bioF b.oH et bioC reconnus 
Neanmo.ns .I est utile de completer cette information par un test d'activite des produ.ts de ces aene, 
clones a part.r de B. sphaencus. Le produit du gene b,oF de E. coli a ete caracterise comme catalyint la 
ont IT 3 '° n U P : m , e ' 0y : C ° A ", en KAPA (Eisenber 9- 1 968). Les produi.s des deux genes bioC 1Tb oTne 
sent pas clairement .dantif.es a I'heure actuelle ; une hypothese citee dans la litteraL (Eisenbe 19851 
:™ qu h ! ls « d e "t P° ur ,es P r °teines impliquees dans la biosynthese du pimeloyl-CoA On a tele s ni 
sequence b.oF. C. H assure specifiquement la transformation du pimelate en KAPA 

rtl| L ';^ Crt8Ur d ! 13 P , artie C ° dante FCH de B - s P h aericus (recupere sous forme du fragment EcoRV-Sohl 
TJITT a ^° C ' 6 3U fr39ment Sph '- Sphl du pTG1436 ' K 9«*» ensemble) a ete fusionn' au promoteur du 
gene conferant la resistance a la tetracycline de pBR322 pour donner le plasmide pTGme afin Tobltnl fin 
n.veau d'express.on signrficatif des proteines associees aux genes bioF C H 

,olTrh?rr id l a e " s,jite / t6 introduit dans des cellules competentes de la'souche bioH de E coli Cette 
souche recombinants est ensurte mise en culture a 37'C pendant 48 heures dans le milieu GP (pou 1 Mtrl 

1 7%n ^n 9 : ^° t60Se Pept ° ne : 30 9 1 Casamino acids vitamin « Tee : 5 g ; K 2 HOP 1 g KG • 

MgSO*-7H 2 0 : 0,5 g ; FeSO«-7H 2 0 : 0.01 g ; MnSO^HaO : 0,001 g P H 6 8-7 Th am ne-HQ ' 20 1 , n 

additionne d'amp.cilline 100 uG/ml et de pimelate (pH 7 5) 0 5 mg/ml '".amine HQ 20 |igj 20 
Une al.quote du sumageant {5 uJ) est ensuite mise en chromatographic sur plaque de silice (solvant 

Dans ces conditions, on peut mesurer de maniere reproductible une quantite 'de 85 uq (exorimee en 
equivalents b.otine) de KAPA par ml de sumageant de culture M (expnrnee en 

Le temoin dans cette experience est la meme souche contenant le plasmide pBR322 mise en culture dans 
les memes conditrons. Dans ce cas aucune detection sicnifi^vP de KA^A ne , oairt mi , ! 

II est done demontre - .V f ne peut etre mibS sn ev| dence. 30 

suffisantes dans la transformation du pimeiate en KAPA, s^X Z'^'^^cT^ * 
Depdt des souches representatives de Invention 

CuZ^Ttl ^ E ' COli 0600 PTG14 °° 6t R8M pTGU18 ont M d ^P° s ees a la Collection Nationale de 
Cultures de M.croorgan.smes de rinstitut Pasteur, 28 rue du Docteur-Roux - 75724 Paris ^ Cedex iS le 2I 
septembre 1986 sous les no 1-608 et 1-609. e 26 
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Revendlcations 



55 



b^^ ta ? k S.^^ n ^ n,e produit de run des s — de - — - 

. gene bioA 
. gene bioD 
. gene bioF 

. gene bioC 6Q 
. genebioH 

produ'X^esrBirbioi 3 reVendiCati ° n ' CaraC,6riS6a 6n " ^ COde PO- -zymes 
3) Sequence d'ADN selon la revendication 1, caracterisee en ce qu'elle code pour les enzymes 
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produits des genes bioD, bioA et bioB. 

4) Sequence d'ADN selon la revendication 1, caracterisee en ce qu'elle code pour les enzymes 
produits des genes bioD. bioA, bioB et bioF. 

5) Sequence d'ADN codant pour i'enzyme produit de Tun des genes suivants de la chaine de 
5 biosynthese de la biotine chez les bacteries: 

. bioF et bioC 
. bioF et bioH 
. bioF, bioC et bioH. 

6) Sequence d'ADN selon la revendication 5, caracterisee en ce qu'elle code, en outre, pour au moins 
JO I'enzyme produit de i'un des genes suivants : 

. bioA 

. bioA etbioD. 

7. Sequence d'ADN selon I'une des revendications 5 ou 6, caracterisee en ce qu'elle code pour les 
enzymes produits des genes bioD, bioA et bioB. 
15 8) Sequence d'ADN selon Tune des revendications 1 a 7, caracterisee en ce qu'elle est depourvue des 

sequences naturetles assurant le controle de la transcription des enzymes de la voie de biosynthese de la 
biotine chez la bacterie d'origine. 

9) Sequence d'ADN en ce qu'elle correspond a tout ou partie de la sequence decrite dans les figures 4 
a8et 17a 19. 

20 10) Sequence d'ADN selon I'une des revendications 1 a 9, caracterisee en ce qu'elle provient d'une 

souche de Bacillus. 

11) Sequence d'ADN selon la revendication 10, caracterisee en ce qu'elle provient d'une souche de 
Bacillus sphaericus. 

12) Vecteur plasmidique comportant au moins une sequence selon I'une des revendications 1 a 1 1 . 

25 13) Vecteur selon la revendication 12, caracterise en ce qu'il s'agit d'un vecteur qui comporte les 

sequences d'ADN permettant son integration dans un chromosome dans la souche note. 

14) Vecteur selon la revendication 13, caracterise en ce qu'il comporte au moins une sequence 
homologue d'une sequence presente dans le genome de la souche a transformer et assurant 
('integration. 

30 15) Vecteur selon la revendication 14, caracterise en ce que la sequence homologue est une sequence 

genomique naturelle. 

16) Vecteur selon la revendication 14, caracterise en ce que la sequence homologue est une sequence 
qui a ete integree dans le genome grace a un vecteur plasmidique d'integration. 

17) Vecteur selon la revendication 16, caracterise en ce que le vecteur plasmidique specifique 
35 comporte au moins un gene de resistance a un antibiotique et un gene marquer sous la dependance d'un 

promoteur de la souche a transformer. 

18) Vecteur selon la revendication 17, caracterise en ce que le promoteur est un promoteur inductible. 

19) Vecteur selon la revendication 18, caracterise en ce que le vecteur plasmidique d'integration est le 
plasmide pTG475. 

40 20) Vecteur selon la revendication 12, caracterise en ce qu'il comporte une origine de replication 

autonome. 

21) Vecteur selon la revendication 20, caracterise en ce qu'il s'agit d 1 une origine de replication 
autonome dans une souche de Bacillus ou une souche d'Escherichia. 

22) Vecteur selon I'une des revendications 20 et 21 , caracterise en ce que les sequences d'ADN codant 
45 pour les enzymes de la chaine de biosynthese de la biotine sont flanquees d'eiements assurant leur 

expression dans la souche note. 

23) Vecteur selon la revendication 22, caracterise en ce que parmi les elements assurant leur 
expression figure un promoteur et un terminateur efficaces dans la souche hote. 

24) Cellules transformees par un vecteur selon I'une des revendications 12 a 23. 

50 25) Ceilule selon la revendication 24, caracterisee en ce qu'il s'agit d'une bacterie choisie parmi les 

genres Bacillus, Escherichia ou Pseudomonas. 

26) Cellule selon la revendication 24, caracterisee en ce qu'il s'agit d'une levure du genre 
Saccharomyces. 

27) Cellule selon la revendication 25, caracterisee en ce que la bacterie est choisie parmi Bacillus 
55 sphaericus, Bacillus subtilis et Escherichia coif. 

28) Cellule selon Tune des revendications 24 a 27, caracterisee en ce que la cellule transformee est une 
cellule productrice de biotine ou de I'un de ses vitameres. 

29) Procede de preparation de biotine caracterise en ce qu'on fait fermenter un milieu de culture 
contenant au moins de Pacide pimelique ou I'un des vitameres de la biotine par des cellules selon I'une 

60 des revendications 24 a 28, permeables a I'acide pimelique ou au dit vitamere de la biotine et en ce qu'on 

recupere la biotine formee. 

30) Procede selon la revendication 29 caracterise en ce que le vitamere de la biotine est obtenu par 
fermentation d'un milieu de culture contenant au moins de I'acide pimelique par une cellule selon I'une 
des revendications 24 a 28 produisant (edit vitamere. 

65 31) Procede selon la revendication 30, caracterise en ce qu'on effectue une co-fermentation de deux 
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60 70 80 90 100 

TTCCTATGGC CGTATGCATT GAGATTTTTT CTCGATGTTC TGCTTGCAAT 
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GTTCGATATT CTTCTTGCCG AATAGCTACA CGATACCAAA ATTCATAACG 



. 160 170 180 190 200 

DAACGGTAAA TCTCTTATTT CGTAAGTAAG CAAAGTATTT AAAATACTGC 

210 220 230 240 250 

TCATTTGTTC ATATGT^TCT AGCTTTTTAT CTGTCTCCTT AAATAGTCCA 

260 270 280 290 300 

AACATTTTGC CACCCCCTGT TTTGATTAAT ACTACAACCT ATGATAAAAA 

310 320 330 340 350 

CCCTTTAATA TTTCTTGGGA AATAATCCAA CGTTGATAAA ACGGGGTGAA 

360 370 380 390 40Q 

TATCCGATCA ATCGAGTGAA ATTTAGGATA GAATACCCTC* GGAAAAAGCA 



410 420 430 

TTATCTGAAT CATTTATGTA AAAATGCAAA 



440 450 
AAAAGGCATT TACAAAAGGA 



460 470 430 

AAAAGAATGT GTTAACTTAA AAACTATAGT 



TGGTT 
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FIG. 5 

AAAAAGAATGTGTTAACTTAAAAACTATAGTTGGT 

•a, BBS 

TAA CTA AAA GAG GGG GAG GTA C AG |T T G [ CAA 
Leu Lys Glu Gly Glu Vol Gin Leu Gin 



m mm 



515 

CAC TTT TGG GTT GTT GGA ACA GAT ACA GAT 
His Phe Trp Val Val Gly Thr Asp Thr Asp 

545 

GTT GGA AAA ACA TTT GTC ACC ACA TTA TTA 

Val Gly Lys Thr Phe Val Thr Thr Leu Leu 

575 

lATGl CGT AAT lTTGl CAA AAA CAG GGC GTA CGT 

Met Arg Asn Leu Gin Lys Gin Gly Val Arg 

605 

GTA ACG CCT TAT AAA CCA GTC CAA ACT GGT 
Val Thr Pro Tyr Lys Pro Val Gin Thr Gly 

635 

GAA GTG TAT GAT GGT G A A CAA GCC TAT TAC 
Glu Val Tyr Asp Gly Glu Gin Ala Tyr Tyr 

665 

TTC GAC ACA GCG ATG TAT GAA AAA TAT TCC 
Phe Asp Thr Ala Met Tyr Glu Lys Tyr Ser 

695 

TTG CAA TTG CTA GAC AGA GAG AAT TTA AAT 
Leu Gin Leu Leu Asp Arg Glu Asn Leu Asn 

725 

GGC TAT TCA TTT AAA GAG GCT GCA T CG CCA 
Gly Tyr Ser Phe Lys Glu Ala Ala Ser Pro 

755 

CAT TTT GCG GCT CAA CTG GAG GGG CAG CAA 
Mis Phe Ala Ala Gin Leu Glu Gly Gin Gin 
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785 

ATT G AC ACA C AG CAG TTA TTA A AG CAA A T G 
lie Asp Thr Gin Gin Leu Leu Lys Gin Met 

8 1 5 

CAA CTT TTA CAG CAA ACA TGG GAT GTT GTT 
Gin Leu Leu Gin Gin Thr Trp Asp Val Val 

845 

ATT TGT GAA GGA GCG GGT GGG CTC TTT GTG 
Il« Cys Glu Gly Ala Gly Gly Leu Phe Val 

875 

CCA TTA GAT GCA TGT GGC GAA AC G ACA TTG 
Pro Leu Asp Ala Cys Gly Glu Thr Thr Leu 

905 

TTG GAT GTC ATT GTT GAA AG T AAA CTA CCC 
Leu Asp Val lie Val Glu Ser Lys Leu Pro 

935 

GTT GTC GTG GTT ACA CG A ACA GCA CTA GGA 
Val Val Val Val Thr Arg Thr Ala Leu Gly 

965 

ACA ATI AAC CAT ACG CTC TTA ACG TTA GAG 
Thr lie Asn His Thr Leu Leu Thr Leu Glu 

995 

GCA TTG ACT ACA CGG AAA ATT GAA GTG CTT 
Ala Leu Thr Thr Arg Lys He Glu Val Leu 



0 2 6 6 1 4 G 



FIG.5 

1025 

G6T CTT ST A TTT AAC 6GT GAT ATG GGG AGC 
Gly L«u Val Phe Asn Gly Asp Met Gly Ser 



1055 

AGG ATG GAG CAA GAC A A T ATC CAA ACG ATT 
Arg Met Glu Gin Asp Asn He Gin Thr lie 



1085 

TTA CAG TAT TAT AC A TTG CCC TAT ATG ACG 
Leu Gin Tyr Tyr Thr Leu Pro Tyr Met Thr 



1115 

ATA CCA AAG CTG GAA GAG CTG TCG GAC ATT 
lie Pro Lys Leu Glu Glu Leu Ser Asp He 



1 145 

AAT GAG TAT GCA ATT ACG GGC ACA TCA TTG 
Asn Glu Tyr Ala He Thr Gly Thr Ser Leu 



1 175 

TTT GAA AGG CTG ATT AGA CGT GAA ACA AQT 
Phe Glu Arg Leu He Arg Arg Glu Thr Ser 



1205 

ATT AAC TGA GCT ACA AGA 
II© Asn *** 



1235 

AAA AGA TTT ACA ACA TGT 
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F1G-6 

GT ATGC AAT T ACGGGCAC ATCATTGTTTGAA AGGC 



1185 , 

T6A TTA 6AC ^GIGl AAA CAA GTA TTA ACT GAG 
••• Leu Asp Val Lys Gin Val Leu Thr Glu 

1215 

CTA CAA GAA AAA GAT TTA CAA CAT GTC TGG 
Leu Gin Glu Lyi Asp Leu Gin His Val Trp 

1 245 f— i 

CAT CCT TGC TC A CAft |aTG) AAA GAT TAT GAG 

His Pro Cys Sar Gin Met Lys Asp Tyr Glu 
12^5 

GCT TTT CCA CCA ATC GTT ATA AAA AAA GGC 
Ala Phe Pro Pro IU Val He Lys Lys Gly 

1 305 

GAA GGT GTA TGG CTG TAT GAT GAA CAG AAT 
Glu Gly Val Trp Leu Tyr Asp Glu Gin Asn 

1335 

CAA CGC TAT CTT GAT GCG GTA TC T T C A TGG 
Gin Arg Tyr Leu Asp Alo Val Ser 3er Trp 

1365 

T66 6TC AAT TTA TTT G6A CAT GCC AAT CCA 
Trp Val Asn Lau Pha Gly Mis Ala Asn Pro 

1 395 

CGT ATT AGC CAA GCA TTA AGT GAA CAA GCA 
Arg Ila Sar Gin Ala Lau Sar Glu Gin Ah 

TTT ACG |T TGj GAG CAT ACA ATT TTT GCG AAT 
Pha Thr feu Glu His Thr lie Pha Aln Asn 
1455 

TTT TCA CAT GAG CCA GCG ATT AAA CTC GCA 
Pha Sar His Glu Pro Ala Ila Lys Lau Ala 

1485 

CAA AAA TTA GTA GCT TTA ACA CCA CAA AGT 
Gin Lys Lau Val Ala Lau Thr Pro Gin Sar 
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1515 

TTA CAA AAA OTA TTT 
Ltu Gin lys Val Pha 

1545 

TCA TCT 6CT ATA 6AA 
Sar Sar Ala IU Glu 

1 575 

AGT TTT CAA TAT CAT 
Sar Pha Gin Tyr His 

1605 

ACG CAA AAA AAA CGC 

Thr Gin Lys Lys Arg 
1635 

6AT 6CC TAC CAT GGT 

Asp Ala Tyr His Gly 

1665 

TTA TCC GTC GGT GGC 
Lau Sar Val Gly Gly 

1695 

GAA GTG TAT CAA CCA 
Glu Val Tyr Gin Pro 

1725 

6TA CGA 6CA CAA 66C 
Val Arg Ala Gin 61y 

1755 

TGC CCA TTC AAG CAT 
Cys Pro Pha Lys His 

1755 

CAT GCC CAA TGT ATT 
His Ala Gin Cys Ila 
1615 

CA6 TT6 C6C ATG CAT 
61n Lau Arg Hat His 

1045 

GCG GTT ATT ATT GAG 
Ala Val Ila Ila Glu 



FIG-6 

TTT GCA GAT A AT GGT 
Ph« Ala Asp Asn Gly 

GTC GCT TTA AAA [aTg| 
Val Ala Lau Lys hTT 

ATG CAA ACG GGG AAA 
Mat Gin Thr Gly Lys 

TTT TTG GCA TTA ACG 
Pha Leu Ala Lau Thr 

6AA ACA TTA GGT GCT 
6lu Thr Lau Gly Ala 

GTA GAT CTT TAT AAC 
Val Asp Lau Tyr Asn 

CTG TTA TTG GAT ACG 
Lau Lau Lau Asp Thr 

CCA GAT TGT TTC CGT 
Pro Asp Cys Pha Arg 

CAT CCG GAT AGT TGC 
His Pro Asp $ar Cys 

AGT TTT GTA GAG GAT 
Sar Pha Val Glu Asp 

CAT AAG GAA ATT AC<3 
His Lys Glu Ma Thr 



CCA CTC ATT CAA GCG 
Pro Lau Ila Gin Ala 
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1875 

GCA GCA GGG ATG AAA 
Ala Ala Giy Mat Lys 

1905 

TAT TT6 CGA C6T TTA 
Tyr Leu Arg Arg Lou 

1935 

CAA TAT GAT GTG CAT 
Gin Tyr Asp Vai His 

1965 

ATT GCT GTA GGT TTT 

Ila Ala Val Giy Pha 
199$ 

CTT TTT 6CC T6T 6AG 

Lau Pha Ala Cys 61u 

2025 

CC6 GAT TTT ATG TGT 
Pro Asp Pha Mat Cys 

2055 

ACA GGT GGG TAT TTA 
Thr Giy Giy Tyr Lau 

2005 

AT6 AC6 AC6 AAT GAT 

flat Thr Thr Asn Asp 

2115 

TAT GAT GAT TAT GCC 

Tyr Asp Asp Tyr Ala 

2145 

TTA CAT TCA CAT AGT 
Lau His Sar His Sar 
2175 

CTT GCC T6C CGT GTT 
Lau Ala Cys Arg Val 

2205 

GCG ATA TTT GAA GAA 
Ala I la Pha Glu Glu 



FIG-6 

ATG TAT CCA GCT ATT 
M9t Tyr Pro Ala II* 

CGT GAA CTA TGT ACG 
Arg Glu Lau Cys Thr 

CTA ATT GCA GAC GAA 
Lau Ila Ala Asp Glu 

GGG CGC AC A GGT ACA 
Giy Arg Thr Giy Thr 

CA6 GCT AAT ATC TCT 
Gin Ala Asn Ila Sar 

TTA TCA AAA GGT TTA 
Lau Sar Lys Giy Lau 

CCA CTG TCT GTC GTA 
Pro Lau Sar Vai Val 

GTA TAT C AG GCA TTT 
Vai Tyr Gin Ala Pha 

ACG ATG AAG GCG TTT 
Thr hat Lys Ala Pha 

TAC ACA GGG AAT ACA 
Tyr Thr Giy A S n Thr 

GCT CTA GAG GTA TTG 
Ala Lau Glu Val Lau 

GAA CAG TAT ATA GAC 
Glu Gin Tyr Ila Aap 
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2235 

GTT GTG CAA GAC AAA GGT GAA CGC A T G CGA 
Val Val Gin Asp Lyi Giy Glu Arg M«t Arg 

2265 

AA6 CTA GCC TT6 6A6 GCT TTT AGT GAT TTA 

Lys Lau Ala Lau 61u Ala Pha Sar Asp Lau 

2295 

CCT TTT GTT GGT GAA TAT CGG CAA GTT GGG 

Pro Pha Val Gly Glu Tyr Arg Gin Val Gly 

2325 

TTT GTC GGG GCG ATT GAA CTT GTG GCG A A T 
Pht Val Giy Ala Ila Glu Lau Val Ala Asn 

2355 

C6C GAT ACC AAA GA6 CCA TTA CCG AGT GAG 
Arg Asp Thr Lys Giu Pro Lau Pro Sar Glu 

2385 

GAG CGC ATC GGC, TAT CAA ATA TAC AAA AGA 

Giu Arg Ua 61y Tyr Gin Xla Tyr Lys Arg 
2415 

GCT TTA GCA AAA GGG TTA CTG ATT CGT CCA 

Ala Lau Ala Lys Gly Lau Lau I la Arg Pro 
2445 

CTT 666 AAT 6TT TT6 TAT TTC AT6 CCA CCA 

Lau Gly Asn Val Lau Tyr Pha flat Pro Pro 

2475 

TAC ATT ATA ACG GAC GAT GAA ATG CAA TTT 
Tyr Ila Ila Thr Asp Asp Giu Mat Gin Pha 

2505 

AT6 ATT CAA ACA ACA AAA GAT ACA ATT GTT 
Mat Ila Gin Thr Thr Lys Asp Thr !1« Val 
2535 

CAA TTT TTT 6AA 6A6 C66 6A6 66A TGA 666 
61n Pha Pha 61u Glu Arg Giu 61y »»* 

2565 

CAT 6TT 6AA ACA ACA 6TC AAC 6TT ATC AcTlV 
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FIG. 7 

TATAACGGACGATGAAATGCAATTTA 



2506 ^ 

T6A TTC AAA CAA CAA AA6 ATA CAA [tTg| TTC 

••• Phe Lys Gin Gin Lys I 1« Gin Leu Phe 

2536 ^ 

AAT TTT |TTGj AAG AGC GGG AGG GAT GAG GGC 

Asn Phe Leu Lys Ser Gly Arg Asp Glu Gly 

25 66 

i*T6f TTG AAA CAA CAG TCA ACG TTA TCA CTT 

Met Leu Lys Gin Gin 5er Thr Leu Ser Leu 

2596 ■ 

GT6lATg| ATT 6C6 ATG TTT GCT GC A TTA ACA 
Vel Mat lie Al« n«t Phe Ale Ale Leu Thr 

2626 

GC A GTT GGT GCC TTC ATT AAA ATT CCA TTA 
Ale Val Gly Ale Phe lie Lys lie Pro Leu 

2656 

CCG CTC GTG CCG TTT ACA TTA CAA ATT GTC 

Pro Leu Val Pro Phe Thr Leu Gin lie Val 
2606 

TTT GTC TTT TTA GCG GGT TGC TTA CTC GGT 

Phe Val Phe Leu Ale Gly Cys Leu Leu Gly 
2716 

GGT CGC AAT GGA TTT CAA AG T CAG CTA GTT 

Gly Arg Asn G ly Phe Gin Ser Gin Leu Val 

2746 

TAC ATA GGA ATA GGT TTA GTT GGC TTG CCA 
Tyr lie Gly lie Gly Leu Val Gly Leu Pro 
2776 

GTT TTT ACA CAA GGT GGA G6C ATT ACA TAT 
Val Phe Thr Gin Gly Gly Gly He Thr Tyr 

2806 

GTA TTG CAG CCG ACT TTT GGT TAC TTA ATA 
Val Leu Gin Pro Thr Phe Gly Tyr Leu lie 
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FIG.7 

2836 

GGA TTT GCT CTT GC T GCA TTA GT A ATC GGC 

Gly Phe Ala Leu Ala Ala Leu Val lie Gly 
2566 

TAT AT6 ATT 6AT CGA 6TA 6AA TC A CCA ACG 

Tyr Met H« Asp Arg Val Glu Ser Pro Thr 

2896 

AAA AAG CAT TTC ATT GT T GCC AAT ATT ATA 
Lys Lys His Phe lie Val Ala Asn He lie 
.2926 

GGG CTT ATC ATT ATT TAT GC A GTC GC* GT* 

Giy Leu lie lie He Tyr Ala Val Ala Val 
2956 

CCT TAT TTA TAT GT A 6CA TTA AAT G T A TGG 

Pro Tyr Leu Tyr Val Ala Leu A S n Val Trp 

2986 

TTA AAC ATG AAA TCA AG T TGG TC T CAT GT A 

Leu Asn Met Lys Ser Ser Trp Ser His Val 

3016 

TTT TTA G T A GGC TTT GTC AAT ACT ATT GTT 

Pne Leu Val Gly Phe Val Asn Ser H e Val 
3046 

GCA 6AC TTT T6C TTA GCA ATT 6CT TCT GCC 

Ala Asp Phe Cys Leu Al« Ui Ala Ser Ala 

3076 

CTT TTA GCT GAA CGT CTA TAC AAA GTA TTC 

Leu Leu Ala Glu Arg Leu Tyr Lys Val Phe 
3106 

CGT TCC GCT AGA GCT ATA AAA CTT GTG C A A 

Arg Ser Ala Arg Ala He Lys Leu Val Gin 

3,36 3166 
ATT 6AA AA6 GAG AAT GTT TAG TGA ATT GGT TAC AAT 
lie Glu Lys Glu Asn Vel ••« ••• 



TAG CAG ATG AAG TGA TTG CAG GCA AGG TA 
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TATAAAACTTGTGCAAAT 



DBS 

3138_™Z. 



T6A AAA GGA GAA f GT TTAJGTGJAAT TGG TTA 

••• Lys Gly Glu Cys Lau V 9 1 *tn Trp Ltu 

3168 

C A A TTA GC A GAT GAAJgTGJATT GCA GGC AAG 

Gin Leu Ala Asp Glu V a I lie Ala Gly Lys 

3198 

GTA ATT AGC GAT GAT GAG GCA CTT GCC ATT 

Val lie Sar Asp Asp Glu Ala Lau Ala lie 

3228 

TTA AAT AG T GAT GAT GAT GAT ATT TTA AAG 

Leu Asn Sar Asp Asp Asp Asp I la Lau Lys 

3258 ^ 

CTAjATGJGAC GGC GCA TTT GCC ATT CGT AAG 

Leu Met Asp Gly Ala Pha Ala Ila Arg Lys 

3288 

CAC TAT TAC GGT AAA AAA GTA AAG TTA AAT 

His Tyr Tyr Gly Lys Lys Val Lys Lau Asn 

3318 

ATG ATT ATG AAT GCT AAA AG T GGC TAT TGC 

Wat Ila Hat Asn Al« Lys Sar Gly Tyr Cys 

3348 

CCA GAG GAT TGT GGC TAT TGC KG CAG TC A 

Pro Glu Asp Cys Gly Tyr Cys Sar Gin Sar 

3378 

TC T AAA TCG ACC GCT CCT ATT GAG AAA TAT 

Sar Lys Sar Thr Ala Pro Ila Glu Lys Tyr 

3408 

CCG TTT ATT AC A AAA GAA GAA ATA TTA QCG 

Pro Pha lie Thr Lys Glu Glu Ila Lau Ala 

3438 

GGG GCA AAG CGT GCG TTT GAA AAT AAA ATT 

Gly Ala Lys Arg Ala Pha Glu Asn Lys Ila 
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3468 FlG - 8 
GGT ACG TAT TGC ATC GTC GCA AGC GGA CGT 
Gly Thr Tyr Cys IU Val Ala S cr Gly Arg 

3498 

GGG CCG ACT CGT AAA OA T GTC AAT GTA GTG 
Gly Pro Thr Ar 9 Lys Asp Val Asn Val Val 
3528 

AGT G A A GCC GTT G A A GA A ATT AAA GCA AAA 
S#r Glu Ala Val Giu Glu I 1 • Lys AM Lys 

3558 

TAT GGC.TTA AAA GTT TGC GCT TGC T T A GGT 
Tyr Gly Lau Lys V« I Cys A la Cys L « u Gly 

3588 

TTA CTA AAA GAA GAA CAA GCA C A A C AA TTA 

Leu Lys Glu Glu Gin Ale Gin Gin Lau 

3618 

AAA GAA GCG GGT GTT GAT CGC TAC AA T CAT 
Lys Giu Ala Gly Val Asp Arg Tyr A, n His 
36 4 8 

AAC TTA AA T ACA TCA GAG CGT CAC CAT TCC 
Asn Lau A, n Thr $ar Glu Arg His H ls Sen 
367fi 

TAT ATT ACG ACG ACG CAC ACA TAT GAG 4 GAT 
Tyr II* Thr Thr Thr His Thr Tyr Glu Asp 

3708 

CGT GTT AA T A CC GTT GAG GTT GTA AA* AAA 
Arg Val A f n Thr Val Glu Val Val Lys Lys 

3738 

CAT GGT ATT TCC CCA TGT TC T GGA 6CC ATT 
His Gly II* Ssr Pro Cys Sar Gly Ala Il e 

3760 

ATT GG6 ATG AAA GAA ACG AAA ATG GAT GTC 

11* Gly flat Lys Glu Thr Lys Hat Asp Val 

3798 

GTG GAA ATT GCA CGC GCA TTG CAT CAG TTG 

Vsl Glu 11* Ala Ar 9 Ala Lau His Gin Lau 
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3828 

GAC GCG GAT TC A ATT CCA GTT AAC TTC TTA 
Asp Ala Asp Sar I la Pro Val A 9n Ph« Leu 

3858 

CAT GCA ATT *AT GGA ACG AAA CTT GAA GGA 
Mis Ala IU Asp Gly Thr Lys Lau Glu Gly 

3888 

ACA CAG GAC TTA AAT CCT CGC TAT TGC TTA 
Thr Gin Asp lau Asn Pro Arg Tyr Cys Lau 

3918 

AAA GTA TTA GCG TTA TTC CGC TAC AT G AAT 
Lys Val Lau Ala Lau Pha *rg T yr M#t Asn 

3948 

CCT TCG AA6 GAA ATT AGA ATT TCC GGT GGT 
Pro S«r Lys Glu lis Arg H« S ar Gly Gly 

3978 

CGC GAA GTC AAT TTA GGA TTC CTT CAG CCA 
Arg Glu Val Atn Lsu Gly Pha lau Gin Pro 

4Q08 

TTT GGA CTG TAT GCA GCA AAT AG T ATT TTT 
Pha Gly Lau Tyr Ala Ala Asn Sar Ila Ph* 

4038 

GTT G6G GAT TAC TTA ACT ACT GAA GGA CAA 
Vsl Gly Asp Tyr Lsu Thr Thr Glu Gly Gin 
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4069 

GAA 6CC AAT AGC GAT TAT CGT ATG CTT GAA 
Glu Ala Asn S«r Asp Tyr Arg Mtt L«u Glu 

4098 

GAT TTG GGC TTT GAA A TC GAG CTG AC A C A A 
Atp Ltu Gly Ph« Glu I 1« Glu L«u Thr Gin 



4128 

AA6 CAA GAA GAA GC A TTT TGT TCT TAA TTC 
Ly« Gin 61u Glu Al« p n « Cy« S«r •»• 



41S6 

AAC CAA TC A TTA TGA AAT AAA ATC TAC TAC 
4188 

TAC ACA ATA TGA TTA CCT CAA AAC CGT GTG 

4248 

AGCGTCGTGGAAAA66CGC ACA6ACG6T T TTTT6GTCGA 



4278 

TAAAA6A6AAG6AGAAAG6TAAATAAAT6GTTCCGATAATA 



4308 

TACCTATAAAAT6ATGGTT TTCACAAA A TGTTCAA^ GAAA 



4330 4368 

«C*TTTTSAA^rT6A^6TULliM666CTTCACATAAASC^ 
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AAAACAATTTTAATCTfiCCTTCCTATCTAT AAATC-TGTTftACTTAA TTATTATTAAGGTTAACTCftfeATTP.AAr-fiAGTTfen 

1161 

AAT GGG AGC AAT AGG AGG ATG CGA AAG TTT TCT ACA TAT GAT r TT GCT 
Asr, Gly Ar 3 Asn Ar 3 Ar 3 H»t Arg Lys P he g ?r Thr Tyr Asp Leu Als 

11*1 

CAG ATT TCA TTA CTA GCT TGT GTT ATT ATC GTT ACA GGC ATG 
Gin lie Ser Leu Leu Als Cy= Leo He He Us] Thr Gly Met 

— IZ C 1 
TTT AAG ATT CCA ACA GGT ATT CCT GGA TCt'gaG TTT CAA TTA TCA CCA 
Fhe Lys He Pro Thr Gly He Pro Cly Ser Glo Phe Gin Leu S 9r Ala 

1291 

CCG ATT GCC GTT GCG ATT GCA GC'A GTA TTT GGA TTT AAG C^A 
Pro He Ala Usl Ala He Ala Ala 'hi Phe Gly Phe Lys Ar 3 

1211 1?41 

TAT TTT CTT GCG GGA ATC ATT GCA AGT CTA ATC TTA TTT TTA r T A nr, T 
Tyr Phe Leu Als Gly He II? AU Ser Leu He Leu Phe Leu Leu Gi v 

13 7 1 

»TA CAC TCC ATC TTA AAT GTT GAA ATT TCA ATA ATT 7TC CGA 
He His Ser He Leu Asn . Vsl Glu He Ser He He Phe Ar 3 

1401 1431 

TTG ACT GTT GGT CTA ATC ATT GTT TTA TTA GGA ACT TCA ATT err. t.ta 

Leu Tr.r v 3 l Gly Leu He He '.'al Leu Leu Gly Thr Ser He Pro '.'si 
14A1 

CTA GTT GTC CCA GGA CCG ATT GGA ACA ATG GTT GCT AGA CTT 
Leu Val 'J=l Ala Gly P r3 He Ci y Thr Met Vel Ala Ar 3 Leu 



Figure 17a LORF X 
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m 1521 

GGA TTG GCT T T T ACG TTA GGG -CC CCG T7T TIG CCA CTA TTC GTT TTG 
Gly Leu Al? Phe Thr Lei- Glyjhr Fro Phe Leu Pro Leo Phe ','?1 Uu 



1551 

GCG ATT CCA GGG ATG GTC ATT ACG GCT GTC ACT GTT TAT CCA 
A) s lie Pro Gly rtei Vsl Us Thr Ala l' 3 l S?r Vgi Tyr Pr'o 



1531 Ull 

?!! ?h! T A £7 J TA I AT GCA ATT AAT AAG AAA PTA GCA GGT GAT CAT 
Ha Tor Ly S net i eu T yr Ala lie - fi5 n Lys t ys 'J 3 i AU ci y a= p His 



1641 

CAT GTT ACA AAC CTG TTA TAG CAT TCG AAT GCG TGC AG r TCP 
His 1 -'3l AY 3 As'n 'Jal teo m 



16?1 



aaaaaat:;tcgaaggaggagaaaagcathT 1731 
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TTTACCTTACGC.ACCCCGTTTTTGCCACTATTCGTTTTGGCGATTCCAGWATGGTC 

ATTACCGCTGTCAGTGTTTATCCAATAACGAAAATGTTATATGCAATTAATAAGAAAGTAG 

1*» IMP 

CAG GTG ATC ATC ATG TTA GAA ACQ TGT TAT AGC ATT CGA ATG CGT 
Gin Vsl He He Mel Leu Glu Thr Cys Tyr Ser He Ar 3 Met Ar 3 

1678 

GCA GCT GAA AAA AAT CTC GAA GGA GGA GAA AAG CAT ATA TCT GOT 
Ala Ale Glu Lys Asn Ley Clu Gly Glv Civ L^s His He Ser Glv 

1708 l7 38 

GGG GAA CGG ATA GGG AGT GAA TTT CAA ATA GAG CCA ATT GTA AAA 
Gly Glu Ar-j He Gly Ser Glu Phe Gin IU Glu Fro lie Val Lys 

1768 

CAG TTA TTG AAC AAA GCA AGG AAT CAT TCG CGC GGA GAT GCT GAC 
Gin Leu Leu Asr, Lys Ala Ar3 Asn His Ser Ar 3 Gly Asp Ala As? 

I 79 ? 1328 

TTT ATT CAA ATT ACC GTT GAA AAA CTT ACA GGT GAT CAG ATA CTG 
fne He Gin He Thr Uel Glu Lys Leu Thr Gly Aso Gin He Lev 



TAT ATC CCA CCG TTA GAA ATA ACG ACA ATT GAT GAG AGT TCA ATT 
Tyr Het Pro Pro Leu Glu lie Thr Thr He Asp Glu Ser Ser He 

1333 1913 

GAA AGG GCA CAT AAA GAA GCT AGG AC-T ATA TTA ACC TCA GTA GGT 
Glu Ar 3 Ala His Lys Glu AU Ar 3 Ser He Leu Thr Ser Ual Gly 

GTT TCC AAG CAG GCA CAA AAT GTT GCT TTT CAT C-TA CTT GCT AC-T 
Val Ser Lys Gin Ala Gin Asn Ual Ala Phe His Leu Leu AU Ser 

Figure 18a LORF W 
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2008 

AAT CAA AAT CTT CGT GGC GCT ATC CTC CTT CAT AG7 CAfi ACT GG r 
As:. Glr. Asn Le, Ar 3 Ely A1 B He Leu Le, Hi; ?er C-Ir, Thr Gly" 

2028 

TTA CGA CTT GAC AAT CGC GGA CTG AAA GGC GTT Cr.A HTA T"A r GA 
Ley Ar 3 L?« Asp A;n Arg Cly Ley Lys Glyi/el Ar 3 U 5 1 Ser A* 3 

JTC GAT TGC CAA GAC GCT GAT GTA GGT TAC AAT GAG CGT GTT CGT 
He Asp ire Gin Asp flla „ 3l GJy Tyr ^ ^ ^ ^ ^ 

n" , CT * m' m ™ m * Si 5TE 6 « ft « TCI CCG TAT at 
01, U, Le, Ah ...... Ala Thr Lyi 'hi Ah tan Ser fro Tyr £ 

E- Ah rf T S r ?T ; KTCA ' WI w « "I ACT r,rn 

I!, Ah Gk. Le, Cys Trt Ser Asp. Asp Pro CI, Tyr l- sI Thr c'iy 

3 iT ,; T f f ? ST »n gct Tw src Ac. fl » n JCS - KI , T . 

Tyr ft| Ser A* «, Gl, He Gly Tyr W Aro He Thr fro Le," 

AAA AGG CAA GGC TGT GAA AGT GGC GGA CGT ATT TTT TIT CTC TCA 
hP S Gly ^ ^ r ^ Ser Gly Gly Ar 3 He Phe Phe u,i £ 

2303 

GAT GAA GTT GAG CTA GAA TCA TAT ATA CAC TAT TTA GAA AGA GAA 
Asp Gl, Val Gl, Le, Gl, Ser Tyr U . His T, r Leu 5lu £ r i, 

CCT ATT CTC ATT AGG GGG CAT TTA AAA TmItG ATC GCT TTC caa 
Pre He Le, I] e A r 3 Gly His Le, Lys m 

23?? 

GGG AAC TGC AAG TAA TAG AAG AGC AAG GAT TGA CAA GGA AGT TAC 



GTT 



Figure 18b LORF W 
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TTTTTTTOTCTCAWTGAACTTMCCTftCftfiTCATfiTATACftCTATTTA^AftWOAACCTATTCTC^TA!) 

2252 2382 

r,GG GCA TTT AAA ATG AAT GAT CCC TTT CCA AGG GAA CTG CAA GTA 
Cly All Phe Lyi Het Asn Asp Ar9 F'he Ars Ars Glu Leu Gin Val 

2412 

ATA GAA GAG CAA GGA TTG ACA AGG AAG TTA CGT TTG TTT TCA ACT 
He Glu Glu Gin Gly Leu Thr Ar$ Lys Leu Ars Leo F'he Ser Thr 

2442 2472 

GGA AAT GAA ACT GAG GTA GTG ATG AAT GGT AAG AAA TTT TTG CTA 
Gly Asn Glu Ser Glu I'll Ual Met Asn Gly Lys Lys F'he Leu Leu 

2502 

TTT TCA TCG AAT AAC TAC TTA GGC CTT GCA ACA GAT AGT CC-T TTG 
F'he Ser Ser Asn Asn Tyr Leu Gly Leu Ala Thr Asp Ser Ar3 Leu 

^•32 2562 

AAA AAG AAA GCA ACT GAA GGC ATT AGT AAA TAC GGT ACA GGC GCT 
Lys Lys Lys Ala Thr Glu Gly He Ser Lys Tyr Gly Thr Gly Ala 

2592 

GGC GGT TCT CCA CTT ACA ACT GGA AAC TTC GAC ATT CAT GAA CAG 
Gly Gly Ser Ar3 Leu Thr Thr Gly Asr. F'he As? He His Glu Gin 

2622 2652 

CTA GAA TCT GAA ATT GCA GAT TTT AAA AAG ACT GAA GCG GCC ATT 
Leu Glu Ser Glu He Ala Asp Phe Lys Lys Thr Glu Ala Ala He 

2632 

GTA TTC AGC AGT GGG TAT TTA GCG AAC GTA GGT GTG ATT TCG AGC 
Ual F'he Ser Ser Gly Tyr Leu Ala Asn Ual Gly Ual He Ser Ser 

2 7 1? 2742 

GTG ATG AAG GCA GGA GAT ACT ATC TTT TCT GAT GCT TGG AAT CAC 
Val het Lys Als Gly r;o Thr lie F'he Ser Asp Ala Trp Asn Hi? 



Figure 19a LORF F 
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GCG AGT ATT ATA GAT GGT TGT CGA TTA ACT AAA GCC AAA t-CO •- 
Al? C-er He lie Asp Gly Cys Ar3 Leu 5?r L y= A 1 .? Lys Thr II? 

2S02 283 2 

GTT TAT GAA CAT CS.r. g;t ATG CTG GAT TTA GAG CGG AAA TTA AEG 
'••si Tyr Gl-.i Hi; Al; : s? H?t U 3 1 Asp Leu Glu ^3 Lys Leu Ar 3 



■on 



CAA TC-A CAT GGG GAT GGA TTG AAC- TTC ATC C-TA ft~G GAT GGC GTT 
Gin Ser His Gly A*c. Gly Leu Lys Phe lie '-'<i Thr Asp G 1 y \i\ 

2892 2922 

TTT AGT ATG GAT. GGT GAT ATT GCG CCA CTT CCA AAA ATA GTA HAG 
Phe Ser Met a 5? Gly - ;p I]? A1? Pro Lgu f . re Lyg Ilp y?) Gly 

'••r.r 7 
i. Ji 

TT-A GCC AAG GAA TAC AAA GCG TAC ATA ATG ATT GAT GAT GCG CAT 
Lpu Ale Lys Glu Tyr Lys his Tyr He Met He Asp ftcp Hi? 



3012 



GCA ACA GGT GTT CTT GGC AAT GAT GGT TGT GGT ACC GCT GAT TAT 
Ala Thr Gly y 3 i Leu Gly Asn Asp Gly Cys Gly Thr Ala Asp Tyr 

TTT GGT TTG AAA GAT CAG ATT GAT TTT ACA GTA GGC ACG HE A"- 
Phe Gly Leu Lys Asp Glu He Asp Phe Thr Val Gly Thr Leu Ser 

W7 2 m ' 

AAA GCG ATT GGT GCA GAG GGT GGA TTT GTA TCG ACA TCA TCC ATT 
Lys Ale He Gly Ala Glu Gly Gly Phe Usl ?er Thr Ser Ser He 

3132 

GCT AAG AAC TAT TTG TTA AAT AAC GCC CGA TCT TTT ATT TTC C^A 
Al? Lys Asn Tyr Leu Leu Asr. Asn Ale Ar* Ser Phe He Phe Gin 

3162 31°2 

ACA GCT TTA TCG CCA AGT GCG ATT GAA GCA GCG CGA GAA GGC ATT 
Thr Ala Leu Ser Pro Ser Ala lie Glu Ala Ala Ar 3 Glu Gly He 



Figure 19b LORF F 
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3222 

TCC ATC ATA CAG AAT GAG CCC GAG CCC AG A AAG CAA TTG CTG AAA 
S5r lie He Gin Asn Glu Pro Glu Ar 3 Ar«3 Lys Gin Leu Leu Ly = 



AAT GCG CAG TAG TTA r C . a XTG AAA TTA GaTgaA TCT GGT TTT GTfi 
Asn Ale Gin Tyr Leu A' 3 Leu Lys Leu Glu Glu Ser Gly Phe Vsl 

3312 

ATG AAA GAA GGG GAA ACA CCT ATT ATT TCT CH ATC ATT iTj G r -T 
Het Lys Glu Gly Glu Thr Pro He He Ser Leu He He Gly Gh- 

;342 

TCT CAT GAA GCC ATG CAG TTT TCT GCG AAA CTA CTG GAT GAA GGT 
Ser His Glu Ala Met C-lr, Phe Ser Ala Lys Leu Leu Asp Glu Gly 

CTC TTT ATT CCA GCG ATT CGA CCA CCA ACA GTG CCC AAA GCG TCA 
■-'31 Phe He Pro Ala He Ar-j Pro Pro Thr '.'al pro Lys Gly Ser 

3462 

AGT CGG TTG CGT ATA ACG GTA ATG GCT ACA CAT ACA ATA CAG TAG 
Ser Ar 3 Leu Ar 3 He Thr Val Het Ale Thr His Thr lie Glu Gin 

3492 

CTC GAT ATG GTC ATT AGT AAA ATT AAG AAA ATA GGA AAA GAA ATG 
Leu Asp hst Ual He Ser Lys lie Lys Lys He Gly Lys Glu Met 

JJ - U 3552 

GCP ATT GTA V ft T ^ TTT GAG TCP CT G CCA CTC AAA CAA T TT TTT 
Gly He Ual xx> " ~~ <l 1 

3532 

GAT TGC TTT TTC TTA TTA ATT ACA TAG CAC TAA C 



Figure 19c LORF F 
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